Bootstrapping (statisztika)

A bootstrapping egy statisztikai eljárás, amely az adatok (vagy egy, az adatokból becsült modell) újramintavételezésével (gyakran visszatevéssel (with replacement - WR) - amikor egy elem többször is előfordulhat a mintában) statisztikai mutatók eloszlásának becslésére szolgál.[1] A bootstrapping módszerrel ismételt mintavételezés segítségével becsléseket készítünk, és ezeket olyan mérőszámokkal értékeljük, mint a torzítás (mennyire tér el a becslés a valós értéktől), a variancia (a becslések szórása), a konfidenciaintervallumok (a becslés megbízhatósági tartománya), és a predikciós hiba (a becslés pontossága), hogy jobban megértsük, mennyire megbízhatóak az eredményeink. [2][3] Ez a módszer lehetővé teszi szinte bármilyen statisztikai mutató mintavételi eloszlásának becslését véletlen mintavételezési eljárások alkalmazásával. [1]

A bootstrapping módszer az eredeti becsült érték tulajdonságait (például a varianciáját) úgy méri, hogy az adathalmazból véletlenszerűen többször mintát vesz, és ezek alapján elemzi a minta jellemzőit. A bootstrapet bevezető Efron tanulmányának[4] egy kulcsfontosságú eredménye, hogy a visszatevéses mintavételezést alkalmazó bootstrap módszerek kedvezőbb teljesítményt nyújtanak a korábbi, visszatevés nélküli mintavételt alkalmazó bootstrap módszerekhez képest, mint például a jackknife A bevezetése óta azonban a bootstrap számos változatát javasolták, beleértve a visszatevés nélküli mintavételezést vagy az eredeti adatoknál nagyobb vagy kisebb bootstrap-minták létrehozását.

A bootstrapping hipotézisvizsgálatok felépítésére is használható.[5] Gyakran használják alternatívaként a paraméteres modellre alapozott statisztikai következtetéssel szemben, különösen akkor, ha a paraméteres eljárás feltételei megkérdőjelezhetőek, vagy ha a paraméteres következtetés lehetetlen vagy bonyolult képleteket igényel a standard hibák kiszámításához.

  1. a b Horowitz, J. L. (2019). Bootstrap methods in econometrics. Annual Review of Economics, 11, 193–224. https://doi.org/10.1146/annurev-economics-080218-025651
  2. Efron, B., & Tibshirani, R. (1993). An Introduction to the Bootstrap. Boca Raton, FL: Chapman & Hall/CRC. ISBN: 0-412-04231-2
  3. Efron, B. (2003). Second thoughts on the bootstrap. Statistical Science, 18(2), 135–140. https://doi.org/10.1214/ss/1063994968
  4. Efron, B. (1979). Bootstrap methods: Another look at the jackknife. The Annals of Statistics, 7(1), 1–26. https://doi.org/10.1214/aos/1176344552
  5. Lehmann, E. L. (1992). Introduction to Neyman and Pearson (1933) On the Problem of the Most Efficient Tests of Statistical Hypotheses. In S. Kotz & N. L. Johnson (Eds.), Breakthroughs in Statistics (Vol. 1). Springer-Verlag. ISBN: 0-387-94037-5

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne